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1. La linguistica dei corpora nel mondo slavo e i corpora paralleli 


La linguistica dei corpora, sviluppatasi in ambito anglosassone ormai oltre 
cinquant’anni fa?, ha raggiunto il mondo slavo relativamente tardi. I primi corpora 
delle lingue slave sono comparsi tra la fine degli anni Novanta e gli inizi del Due- 
mila. I maggiori corpora al momento disponibili per le lingue slave sono i Corpora 
Nazionali delle lingue ceca (CNC), bulgara‘, polacca?, slovacca? e russa’ (Nacio- 
nal’nyj Korpus Russkogo Jazyka - NKRJa)* (Reznikova 2009). Tra questi, per di- 
mensioni e livello di specializzazione, emergono in particolare il CNC e il NKRJa. 

Il CNC è un insieme di corpora, raccolti sul sito dell’ Institute of Czech Na- 
tional Corpus grazie al lavoro della Facoltà delle Arti dell’ Universita Carolina 
di Praga’. Il progetto, avviato nel 1994 (accessibile dal 2000), conta ora piu di 
un miliardo di parole ed è annotato morfologicamente". Il NKRJa, invece, nato 


! *]l contenuto del presente lavoro è da attribuire ai singoli autori come segue: 


V. Noseda (parr. 1-2), F. Biagini (par. 3), A. Bonola (par. 4). 

? [primi corpora per la lingua inglese nascono negli anni '60: il Brown Corpus 
negli Stati Uniti e il London-Lund Corpus in UK (McEnery, Wilson 2001: 22-23). 

3 <http://www.korpus.cz/> (ultimo accesso: 15.03.19). 

^ <http://search.dcl.bas.bg/> (ultimo accesso: 15.03.19). 

5. <http://nkjp.pl/> (ultimo accesso: 15.03.19). 

$  <http://korpus.juls.savba.sk/> (ultimo accesso: 15.03.19). 

7 <http://rusorpora.ru/> (ultimo accesso: 15.03.19). 

*  Reznikova (2009) cita anche alcuni corpora minori: FIDA e FidaPLUS, Nova 
beseda e KoRP per lo sloveno, il Corpus nazionale della lingua croata, e quelli della 
lingua bosniaca e serba. 

? <https://ucnk.ff.cuni.cz/english/struktura.php> (ultimo accesso: 15.03.19). 

? [| CNC comprende ora quindici corpora sincronici di lingua scritta (alcuni ge- 
nerali e di vasta portata, altri più specifici e ridotti, quali ad esempio l'ORWELL Corpus, 
che include esclusivamente il romanzo /984 di G. Orwell tradotto in lingua ceca e conta 
80.000 parole); sette corpora sincronici di lingua parlata, di media entità (da 215.000 a 
2.790.000 parole); un corpus diacronico composto da poco meno di due milioni di pa- 
role e da testi in lingua ceca risalenti a sette secoli diversi; otto corpora in altre lingue, 
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nel 2004 (Sicinava 2005) comprende oggi più di cinquecento milioni di parole 
suddivise tra un corpus principale generale (osnovnoj korpus) e dieci sottocor- 
pora specialistici: corpus sintattico, giornalistico, dialettale, didattico, parallelo, 
poetico, della lingua parlata, della storia dell’accento russo, multimediale, stori- 
co. L'intero corpus presenta un'annotazione morfo-sintattica, semantica e meta- 
testuale, e dispone di un motore di ricerca altamente avanzato. 

Nonostante la crescente diffusione della linguistica dei corpora, rimangono an- 
cora relativamente scarse le risorse elettroniche multilinguistiche. Infatti, tra i corpora 
delle lingue slave, solo il CNC e il NKRJa dedicano una sezione ai corpora paralleli 
(d'ora in avanti: CP)". II CNC comprende il progetto InterCorp" con una sezione 
di corpora compilati tradizionalmente (i testi sono selezionati secondo criteri pre- 
definiti) definita core corpus (195 milioni di parole), e un insieme di risorse defini- 
bili come ‘collezioni’ ”, tratte da diverse risorse in parte accessibili anche attraverso 
altri portali e non sottoposte a correzione manuale (es.: Opus" o Sketch Engine'^). 

I quindici CP del NKRJa variano tra loro per entità e tipo!°: il più vasto 
(russo-inglese) conta quasi 25 milioni di parole, il più piccolo (russo-cinese) ne 
comprende appena 55.424. Fino al 2015, tra gli ultimi posti si trovava anche il 
CP italiano-russo (CP ita-ru), nato come corpus pilota bi-direzionale compren- 
dente in tutto cinque testi per un totale di circa 700 mila parole. 

Considerando le potenzialità offerte dai CP per la ricerca scientifica, e consa- 
pevoli del fatto che il corpus pilota ita-ru non possedeva, per le sue dimensioni, i 
requisiti di uno strumento scientificamente valido, abbiamo elaborato un progetto 
per il suo ampliamento, la cui fase iniziale è stata portata a termine nel dicembre 
2015 nell'ambito del lavoro di dottorato descritto 1n Noseda 2016. 


2. L'ampliamento del CP italiano-russo nel NKRJA 


L'ampliamento del CP ita-ru è stato preceduto da un’analisi comparata dei 
migliori CP esistenti, tra cui si è evidenziato, per struttura e rappresentativita, 


tra cui l'italiano (ItWac). Si tratta soprattutto di web corpora, ricavati da testi estratti 
automaticamente dalla rete (Baroni et al. 2009). 

!! Selezioni di testi in una data lingua (A) allineati — generalmente a livello di 
frase — con la rispettiva traduzione in lingua B. 

7? Accessibile dal sito: «https://kontext.korpus.cz/first form» (ultimo accesso: 
15.03.19). 

5 Secondo la definizione di EAGLES (Expert Advisory Group on Language 
Engineering Standards): “words such as ‘collection’ and ‘archive’ refer to sets of texts 
that do not need to be selected, or do not need to be ordered, or the selection and/or or- 
dering do not need to be on linguistic criteria. They are therefore quite unlike corpora" 
(<http://www.ilc.cnr.it/EAGLES96/intro.html>, ultimo accesso: 15.03.19). 

14 <http://opus.lingfil-uu.se/> (ultimo accesso: 15.03.19). 

5 <https://www.sketchengine.co.uk/> (ultimo accesso: 15.03.19). 

Alcuni contengono solo testi letterari, altri hanno testi di diversi generi, oltre a 
variare 1 criteri di selezione dei testi. 
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l'English-Norwegian Parallel Corpus (ENPC), che é servito anche da modello 

per progettare un CP ita-ru che sia: 

1. Corpus di monitoraggio (e non statico): il corpus verrà gradualmente arric- 
chito di nuovi testi. 

2. Corpus bi-direzionale: comprende originali russi con traduzione italiana e 
viceversa, cosi da costituire allo stesso tempo un corpus parallelo e compa- 
rabile, in cui sia possibile confrontare non solo originali in lingua A e tradu- 
zioni in lingua B, ma anche testi originali e traduzioni in una stessa lingua. 

3. Corpus diacronico: con testi di periodi diversi (XIX, XX e XXI secolo). 

4. Corpus di estratti (di 10.000-15.000 parole): la scelta di inserire solo alcuni 
brani, anziché opere intere era inizialmente legata all’ ingente lavoro richie- 
sto dall'allineamento e a problemi di copyright; tuttavia, in seguito, testan- 
do il CP con alcune analisi contrastive (Noseda 2016), ci si é resi conto che 
quando il numero di esempi é troppo elevato, é necessario scartare parte dei 
risultati. Pertanto, pur avendo a disposizione opere intere, la maggior parte 
degli esempi in esse contenuti potrebbero non essere considerati per garan- 
tire un bilanciamento nei risultati. Ci è sembrato dunque più utile incremen- 
tare le dimensioni del CP aggiungendo più estratti di opere diverse, anziché 
opere in versione integrale. 

5. Corpus di prosa letteraria e saggistica: i testi sono stati scelti in base a quan- 
to tradotto dagli inizi del XX secolo in Russia e in Italia e all’impatto che 
hanno avuto alcune opere nella cultura di arrivo. Quest’ ultimo dato si evince 
dal gran numero di versioni esistenti di una stessa opera (cfr. // Cappotto di 
N.V. Gogol”, tradotto in italiano più di trenta volte). Per garantire maggiore 
rappresentatività riguardo ai generi, abbiamo deciso di includere anche testi 
di saggistica appartenenti a diversi ambiti (arte, critica letteraria, epistola- 
rio, filosofia, legge / scienze sociali, memorie, religione / teologia, scienze 
applicate, scienze esatte e naturali, storia / biografia)”. 

6. Corpus polivariantnyj: visto l'elevato numero di versioni pubblicate in Ita- 
lia per alcune opere russe, si è deciso che in una seconda fase il CP ita-ru 
sarà arricchito da più traduzioni di una stessa opera. Ciò è già avvenuto per 
il racconto di Gogol” // Cappotto (15 versioni) e per / racconti di Kolyma di 
V. Salamov (2 versioni). 


In seguito al nostro lavoro da dicembre 2015 il CP ita-ru é salito a 4.066.172 
parole, con 30 opere letterarie russe con la traduzione italiana (estratti e opere 
intere) e 21 estratti di opere letterarie italiane con la traduzione russa. La sezione 
di saggistica contiene al momento solo 5 estratti in lingua russa con traduzione 
italiana. Si prevede di inserire a breve sedici estratti in lingua italiana e undici in 
lingua russa (due opere per ogni genere in entrambe le direzioni). 


17 Per la scelta dei macro-settori ci siamo riferiti all’ Index Translationum, un data- 
base dell'UNESCO che segnala 1 libri tradotti dal 1979 al 2012, dividendoli per generi. 

55 In linguistica dei corpora generalmente si intende per ‘numero di parole’ il 
numero di token, ossia di occorrenze effettive e non di lemmi (definiti types). 
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Tuttavia il CP non rispetta del tutto i criteri sopracitati per via dell’inter- 
vento di una collaboratrice esterna che lavorando indipendentemente ha inse- 
rito testi in un'unica direzione (dal russo all'italiano) e in versione integrale. 
In futuro si prevede di ovviare a questo parziale sbilanciamento inserendo un 
numero maggiore di opere italiane e creando un sottocorpus di testi paralleli in 
versione integrale. 


3. Applicazioni dei corpora paralleli 


In questo paragrafo ci concentreremo su alcune possibili applicazioni 
dei CP soprattutto, ma non solo, nell'ambito della traduzione e della lingui- 
stica contrastiva e tipologica. Il nostro intento é mostrare le potenzialità del 
CP sopra descritto, riferendo di ricerche ed esperimenti realizzati con questo 
e con altri CP. 

Per quanto riguarda la traduzione, i corpora possono essere strumenti pre- 
ziosi per identificare l'equivalente di una data parola in un contesto specifico o 
per utilizzare la lingua in modo naturale, tenendo conto di quali sono le forme di 
espressione più diffuse in un determinato ambito (Bowker, Pearson 2002: 193- 
197). In particolare, il CP si rivela utile nei casi in cui gli equivalenti standard 
forniti dal dizionario non sono accettabili in uno specifico contesto traduttivo. 
L'analisi dei dati del corpus consente infatti di identificare nuovi equivalenti 
e di vedere in quali contesti il loro uso risulta opportuno, riformulando cosi le 
condizioni di equivalenza (Dobrovol'skij et al. 2005: 272)”. 

Ció favorisce l'utilizzo dei corpora anche nella didattica della traduzio- 
ne. Ne riportiamo un esempio: nel corso di Traduzione editoriale per la Laurea 
Magistrale in Specialized Translation (Università di Bologna, sede di Forlì) si è 
lavorato sulla traduzione della congiunzione npuuew? nel seguente passaggio: 


(1) IIpusezew mmm aBa npuMepa pom BirajuMupckoii HKOHBI B HCTODHH 
pycckoit rocyapcTBeHHOCTH, IpHueM B Kaàx;IoM ciryuae BogytrelícrBHue OOpaza 
Ha IIyOJHKy OCyIHeCTBJISJIOCb BO MHOTOM IIOCDe/ICTBOM ero ykpaurenuit. 


Il dizionario monolingue di OZegov fornisce la definizione: “To xe, uro 
IIpHTOM", e per mputom: “Bmecte c TeM, K TOMY Xe, B 7j100aBireuue K TOMY” 
(Ozegov, Svedova 1992); i dizionari bilingui fornivano poi diversi eteronimi: 
“oltre a ciò”, “nello stesso tempo” (Majzel’, Skvorcova 2001), a cui ABBY 


19 Per altri esempi di utilizzo dei CP negli studi di linguistica tipologica si veda 


Sicinava 2013. 

?  Dell'uso di questo tipo di connettori si sta occupando O. In’kova in “OtnoSenie 
soputstvovanija i ego pokazateli v russkom, francuzskom i ital’janskom jazykach", VI 
Congresso Internazionale di Linguistica testuale contrastiva Lingue slave — Lingue ro- 
manze, 16-18 maggio 2019, Cracovia. 
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55, 66 


LINGVO x5 aggiunge un esempio con la soluzione “in più”: “He mpaB, mpHuem 


99 66 


elle copa", “(non solo) non ha ragione, ma in più discute pure". Nel dizionario 
di Dobrovolskaja si trova invece un'unica traduzione, “anzi”: “oH CHAJI 9K3aMeH, 
IIpH4eM ouegp xoponro", “ha superato l'esame, anzi, l'ha superato benissimo". 
Data l'inadeguatezza delle soluzioni proposte per il contesto in esame, si è pro- 
ceduto alla ricerca di rnpsuew sul CP italiano-russo selezionando dapprima il sot- 
tocorpus dei testi con l’italiano come lingua di partenza e traduzione russa. Sono 
state ottenute 20 occorrenze: in 6 casi npuuem risulta aggiunto rispetto al testo 
italiano, dove non ha corrispondenti, in altri 6 rende “e” del testo di partenza, in 
2 occorrenze corrisponde a “ma”, in 2 a “che”, in 1 a «di cui", in 1 ad “anzi” e in 
2 casi a due espressioni complesse: una caratterizzata dalla ripetizione del verbo 
(2) e l'altra dalla struttura “non ..., ma ..." (3): 


(2) Certo voleva qualcosa e lo voleva subito. [Umberto Eco, J nome della rosa 
(1980)] 
Be3ycJIOBHO, eMy GbIJIO UTO-TO OUCH HYXKHO, IIPHTEM HeMejUIeHHo. (trad. russa 
di E. Kostjukovié, 1989) 


(3) [...] e continuava a mordersi le unghie (se le mangiava non alzando un dito alla 
bocca, ma abbassandolo, con la mano a rovescio, il gomito alzato). (I. Calvino, 
Il barone rampante, 1957) 
[...] Teneps ona cepzuro rpbrizzia HorrH, IpH4YeM nojtHocua Masel KO pry 
CBepxy BHH3, IIO/IHHMA5 UIS 3TOTO pyKy H BBICTaBHB JIOKOTb. [I. Kal'vino, 
Baron na dereve, 1965 (trad. it. di Lev VerSinin)] 


Cercando poi nel sottocorpus dei testi russi con traduzione italiana si ri- 
cavano 128 occorrenze. Qui npuuew è reso con le stesse forme già individuate 
nel sottocorpus dei testi di partenza italiani (in particolare la congiunzione “e”, 
e l'assenza di corrispondenti), ma anche con espressioni come: “e oltre a ciò”, 
“e cosi dicendo" (dove il gerundio riprende il predicato precedente), “(e) per di 
più”, “tanto più che”, “anche se", “durante i quali”, “mentre”, “e intanto”, “e al- 
lora”, “in modo che” ed altre. 

Risulta così evidente che npu4uem codifica un significato molto ampio di 
contemporaneità e/o aggiuntivo, il quale, se spesso risulta ridondante e non ri- 
chiede la traduzione in italiano, in altri contesti può essere tradotto con “nello 
stesso tempo”, “e”, “e intanto”, “mentre”; “oltre a ciò”, “per di più”, “tanto più 
che”; con una SE (“che’”?!, “di cui"), con espressioni complesse come in 
(2) e (3) e, infine, per arricchimento inferenziale”, può esprimere altri tipi di 
relazioni transfrastiche e aprirsi a rese quali “anche se" e “in modo che”. Nel 
nostro caso specifico, la soluzione più naturale è risultata quella in cui mpuuem 


non viene tradotto: 


2! Nelle frasi relative appositive “il pronome relativo cumula la funzione di colle- 


gamento anaforico con l’antecedente a quella di congiunzione” (Prandi 2011). 
? Cfr. Prandi (2004: 46-47). 
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(4) Di seguito sono riportati due esempi che evidenziano l'importanza del ruolo 
dell'icona di Vladimir nella storia dello stato russo. In entrambi i casi l’effetto 
prodotto dall'immagine sul pubblico derivava in gran parte dai suoi ornamenti. 


In modo analogo il CP trova importanti applicazioni nella didattica del russo 
L2, poiché l’osservazione delle forme più complesse e oscure per i discenti — 
quali ad esempio i segnali discorsivi — in una grande quantità di contesti d’uso 
consente una più rapida comprensione del loro funzionamento in russo, grazie 
anche alla presenza del testo parallelo in italiano. 

Il corpus fornisce anche utili spunti per l’analisi di diverse traduzioni dello 
stesso testo: nel CP italiano russo questo per ora è possibile nel caso de // cappot- 
to di N. Gogol” (15 versioni) e / racconti di Kolyma di V. Salamov (2 versioni). 

Un'altra applicazione del CP nell’ambito della traduzione riguarda lo studio 
delle caratteristiche specifiche dei testi tradotti. Secondo Teich (2003: 143-147) 
questi ultimi sarebbero caratterizzati da un maggior grado di semplificazione, con 
una minor varietà e densità lessicale; da normalizzazione, ossia la tendenza a ren- 
dere conformi alle caratteristiche della lingua di arrivo gli elementi più peculiari del 
testo di partenza; da un maggior grado di esplicitazione; dall’influsso delle struttu- 
re linguistiche della lingua di partenza su quelle del testo di arrivo. Questo tipo di 
studi prevede l'utilizzo di un corpus monolingue accanto a quello parallelo (alcuni 
esempi sulla base del corpus russo-inglese in Dobrovol'skij et al. 2005: 274-275). 

Per quanto riguarda la linguistica tipologica e contrastiva, accanto ai metodi 
tradizionali (elicitazione di informazioni dai madrelingua o confronto tra descri- 
zioni teoriche esistenti), sta prendendo piede l'analisi di tipo quantitativo basata 
sui dati dei corpora (Teich 2003: 10-12). Nell'ambito della lessicologia contra- 
stiva 1 CP, associati ai grandi corpora monolingui, permettono di identificare i 
diversi significati di un lessema in base ai contesti in cui occorre, individuarne le 
collocazioni e analizzarne la struttura argomentale. Interessante l'esempio propo- 
sto da Dobrovol'skij et al. (2005: 276-277) riguardo alle collocazioni di absolu- 
tely e a6comorgo?. Dell'uso di “assolutamente” e dei suoi equivalenti in russo 
si sta occupando V. Benigni in “Da intensificatore assoluto a segnale discorsivo: 
il caso di ‘assolutamente!’ e dei suoi equivalenti in russo", VI Congresso Inter- 
nazionale di Linguistica testuale contrastiva Lingue slave — Lingue romanze, 
16-18 maggio 2019, Cracovia. Il British National Corpus evidenzia tre conte- 
sti d'uso di absolutely: come intensificatore di un aggettivo che già esprime un 
grado elevato di una caratteristica (appalling, delighted), come intensificatore di 
espressioni di ‘necessità’ (necessary, vital) e come intensificatore di forme che 
esprimono ‘comprensione’, ‘sicurezza’ (clear, sure). Nel CP, invece, l'avverbio 
russo a6comorHo mostra delle differenze nelle sue collocazioni: nel caso dei 
contesti di secondo tipo, a fronte di absolutely in traduzione, nei testi di partenza 


?5 Dell’uso di “assolutamente” e dei suoi equivalenti in russo si sta occupando V. 


Benigni in “Da intensificatore assoluto a segnale discorsivo: il caso di ‘assolutamente!’ 
e dei suoi equivalenti in russo”, VI Congresso Internazionale di Linguistica testuale 
contrastiva Lingue slave — Lingue romanze, 16-18 maggio 2019, Cracovia. 
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russi non si incontra l'avverbio aOcomorTHo, ma altre forme (TeOe HempemeHHO 
HyXXHO) e con l'avverbio predicativo neoóxojmwo ricorrono solo i modificatori 
XXH3HeHHO, upeaBbrdaifHo, rpHHHHmnHajJibHo. Per i contesti del terzo tipo nel CP 
è presente solo un esempio dove ad absolutely corrisponde npekpacno (he un- 
derstood absolutely, ono npekpacHo monano). 

Il CP si presta anche a ricerche in ambito morfo-sintattico, come illustrato da 
V.A. Plungjan? riguardo al valore di presente assunto dal futuro perfettivo russo 
preceduto dalla particella negativa ne. Oltre ai casi già descritti in letteratura, nei 
quali il perfettivo perde il suo valore futurale (“To cater, ro BcTaHeT” ‘un po’ sta 
seduto, un po’ sta in piedi’ e la costruzione negativa con significato di impossi- 
bilità), Plungjan, grazie all'uso dei CP, ha individuato, in altri contesti, tre tipi di 
forme alla prima persona, che egli definisce *immediatnye', poiché l'azione nega- 
ta non avviene già nel momento dell'enunciazione: He ckaxy, He Kam, He rryriy. 
In questi contesti i verbi assumono un valore vicino a quello dei performativi: 


(5) Qual è?-— Non te lo dico. — Ora me lo devi dire. (N. Ammaniti, Jo non ho paura, 
2001) 
I xro 9T0? — He cxaxy. — IHouewy? Tak HeuectHo. [N. Ammaniti, Ja ne bojus’, 
2005 (trad. it. di V. Nikolaev)] 


Il verbo al presente nei testi italiani, francesi e inglesi, a fronte del futuro 
russo nei diversi CP, consente di evidenziare il valore non futurale di queste co- 
struzioni russe — non descritte nelle grammatiche e non immediatamente identi- 
ficabili dai madrelingua — e di fornirne un’accurata descrizione. 

L’utilizzo dei CP si è rivelato molto proficuo anche nell’ambito della frase 
complessa e a livello testuale, in particolare per lo studio dell’espressione delle 
relazioni transfrastiche. In Biagini 2012, ad esempio, è stato evidenziato come la 
relazione finale in russo, oltre che da uroóbi, possa essere codificata da congiun- 
zioni polirematiche come jui / paga / B Onaro Toro uroObr; da locuzioni congiun- 
tive come c IIeJIbIO, C HaMepeHMem, c KesraHHem, c pacuétom; da gerundi come 
IUIAHHDy3, Keras, Meuras, 6oscb; e da rcr» e nycxait. Inoltre, la relazione finale 
puó essere espressa da mezzi diversi dalla frase complessa, come la coordinazio- 
ne e la giustapposizione, eventualmente arricchiti con espressioni anaforiche e 
termini predicativi appropriati (Prandi et al. 2005: 29-30). La pluralità di mezzi 
che il sistema offre al parlante per esprimere un determinato contenuto concet- 
tuale puó anche coincidere in due lingue diverse; tuttavia l'opzione considerata 
più adeguata, ossia la più frequente, è spesso differente. La scelta è determinata 
dall’uso collettivo, dalla realizzazione concreta delle possibilità messe a dispo- 
sizione dal sistema e filtrate dalla norma (cfr. anche Dobrovol'skij et al. 2005: 
273-274). In Biagini 2012 grazie all'utilizzo di un piccolo CP è emerso come 
nell'espressione della relazione finale in italiano prevalgano le strutture ipotatti- 


24 Ciò è avvenuto nell'ambito della lezione Parallel'nyj korpus v naucnych 


issledovanijach, tenuta da V.A. Plungjan il 10 novembre 2016 presso l'Università di 
Bologna, Dipartimento di Interpretazione e Traduzione, Forli. 
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che, mentre in russo quelle paratattiche. Lo stesso tipo di indagine é stato svolto 
per le relazioni concessiva e consecutiva (Biagini 2016a e 2016b). In questi stu- 
di la definizione del contenuto della relazione transfrastica viene utilizzata come 
tertium comparationis per individuare e confrontare la sua realizzazione formale 
nelle due lingue. Effettuando una ricerca dei mezzi di espressione prototipici (ad 
esempio "sebbene" per la relazione concessiva in italiano), si osservano le forme 
corrispondenti nei testi paralleli russi. Ciò consente di verificare quali strutture 
prevalgano nelle due lingue, mettendo in evidenza il ‘genio della lingua’, l'im- 
pronta lasciata sui testi dalle scelte dei parlanti. Sono state cosi identificate forme 
di espressione che tradizionalmente non sono descritte dalle grammatiche, come 
ad esempio “a furia di” come resa di “Tak ..., uro" per la relazione consecutiva. 


4. llCorpus parallelo italiano-russo per l'incremento e il consolidamento 
della ricerca 


Il progetto sopra esposto mira a creare un CP all'interno del NKRJa di alme- 
no 20 milioni di parole e bilanciato dal punto di vista della tipologia testuale, la 
cul interrogazione possa produrre risultati statisticamente rilevanti. Per un simi- 
le scopo è auspicabile lo sforzo congiunto di chi già, fra gli slavisti italiani, usa i 
corpora per le proprie ricerche. Per promuovere una simile collaborazione sarebbe 
utile la creazione di un portale: oltre a raccogliere testi allineati alla loro traduzio- 
ne e addestrare all'uso dei CP per la lingua russa già esistenti (mediante istruzioni, 
esempi e tutorial), contribuirebbe anche a un dibattito scientifico che, basandosi 
sui CP, diffonda e promuova nuovi spunti di ricerca (tramite Forum, webinari, la 
pubblicazione open access dei risultati delle ricerche contrastive russo-italiane). 

Un simile portale potrebbe raccogliere e mettere in condivisione sia i cor- 
pora particolari creati dai singoli studiosi o dai gruppi di ricerca (per lo studio 
contrastivo del lessico, della traduzione, dei linguaggi speciali ecc.) sia eventua- 
li Sovracorpora database (nadkorpusnye bazy dannych), ossia corpora speciali, 
creati sulla base di CP già esistenti ma con annotazioni appositamente studiate 
per la ricerca di aspetti linguistici particolari. Questi corpora di ultimissima ge- 
nerazione sono utili soprattutto per quegli elementi del sistema linguistico che 
sfuggono alle annotazioni morfosintattiche e semantiche dei CP, che spesso ec- 
cedono i confini di parola e sono trascurati dalle grammatiche tradizionali, come 
per esempio connettori, particelle, espressioni polirematiche ecc. Un esempio lo 
abbiamo nel Sovracorpora database per lo studio contrastivo dei connettori in 
francese e russo (Zaliznjak et al. 2015; Zacman et al. 2016). 

Il portale, accanto agli studi linguistici e letterari di tipo contrastivo basati 
sui CP, svilupperebbe infine un secondo ambito, altrettanto importante per la rus- 
sistica italiana: gli studi acquisizionali sulla base dei 1) corpora del russo come 
L2 prodotti da studenti italofoni, 2) corpora del russo degli éritaZniki (un feno- 
meno in grande espansione in Italia) e 3) corpora degli errori (Rachilina 2016). 
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Le applicazioni dei summenzionati filoni di ricerca sarebbero innumerevo- 
li, dalla creazione di grammatiche e vocabolari contrastivi sulla base dei dati dei 
CP, agli strumenti per la traduzione e il sostegno tecnologico e didattico all’in- 
segnamento del russo come lingua straniera. 
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Abstract 


Francesca Biagini, Anna Bonola, Valentina Noseda 
The Italian-Russian parallel corpus in the national Russian corpus: a project for its 
enlargement, applications and future development 


In this paper, we will introduce our project for enlarging the Italian-Russian parallel 
corpus of the NKRJA, presenting as well some current or possible and future applications. 
The enlargement, carried out since 2014, has allowed us to abandon the pilot phase and 
to reach about 4 million words. However, we expect to reach 20 million, which is the re- 
quired size to have a reliable and balanced corpus, another essential qualitative feature 
of parallel corpora. Illustrating its possible applications, we will present some experi- 
mental uses for teaching translation at the University of Bologna and some research in 
the sphere of Russian-Italian Contrastive Linguistics (about the non-temporal value of 
Russian future tense and the expression of the relationship between clauses). Finally, 
we will briefly present a project based on the creation of a portal in order to constan- 
tly enlarge the parallel corpus and promote its use in linguistic and literary research, in 
Translation Studies and in the teaching of Russian as a second language. 


